音声情報処理 08
ピッチの推定
歌唱表現の分析
歌声を⽤いたアプリケーション
歌声とは
歌唱はもっとも⾝近な演奏活動
⽇常的に接する「声」は同⼀⾔語であれば,受信と発信が⽐較的容易 ⾳楽的知識や経験がなくても歌うことはできる
楽曲からのボーカル⾳声の抽出
できることだからこそのニーズ
感動する歌声が聴きたい
うまく歌いたい
要求レベルが高い
歌声分析の価値
学術的観点
鳥の声が歌に聞こえる
歌唱指導へと応⽤
実⽤的観点
合成には分析によって得られた知⾒が必要不可⽋
歌い⽅や発声⽅法が様々
要素技術
歌声特有の動的な変動成分(F0動的変動成分)が存在
歌声中のブレス⾳
⾳声から短時間のフレーム時間を取り出してその区間内での周期を推定
その周期の逆数が周波数
基本周波数の⾼低:ピッチの⾼低
短時間のフレーム内でも微細に変化してしまう
歌唱スタイルや歌唱者に依存せず 4種類存在
滑らかな⾳⾼変化,および,その直後に⽬的⾳⾼を超える時間的な変動成分
同⼀⾳区間で観測される4~8Hzの準周期的な変動成分
⾳⾼変化直前に変化とは逆⽅向に触れる瞬時的な変動成分
発声区間全体に観測される不規則で細かい変動成分
第3〜第5フォルマントが互いに近づいて⼀つの⼭を⽣成したもの
「響く声」「通る声」「張り・ツヤのある声」を特徴づける
ブレス⾳
息継ぎ
歌唱者,楽曲,⾔語,歌唱⼒によらずピークが存在
歌声に基づくアプリケーション
ハミング検索
歌唱に関する⾳響特徴をリアルタイムに可視化
ビブラートの検出など歌唱表現の可視化
歌唱中のブレスを⾃動検出:ブレスを消したり強調したり
研究は両方向から進む